Verallgemeinerte kanonische Verteilung

Thermodynamikvorlesung von Prof. Dr. E. Schöll, PhD

Der Artikel Verallgemeinerte kanonische Verteilung basiert auf der Vorlesungsmitschrift von Franz- Josef Schmitt des 1.Kapitels (Abschnitt 3) der Thermodynamikvorlesung von Prof. Dr. E. Schöll, PhD.

|}}

Motivation

Makroskopische thermodynamische Zustände sind gegeben durch die Mittelwerte

⟨ M (x) ⟩

von Mikroobservablen M(x), interpretiert als Zufallsvariable.

Rückschlüsse von

⟨ M (x) ⟩

auf die Wahrscheinlichkeitsverteilung

ρ (x) ?

Methode

Vorurteilsfreie Schätzung (Jaynes, 1957): (unbiased guess; Prinzip des maximalen Nichtwissens)

Verallgemeinerung des Laplacschen Prinzips vom unzureichenden Grund.
- (Minimum der Shannon- Information $I (ρ (x))$ = Maximum des Nichtwissens $S (ρ (x))$ liefert Gleichverteilung)
Jetzt: Zusätzlich zur Normierung der P_i sind die Mittelwerte von m Zufallsvariablen:

\begin{aligned} {M_{i}}^{n} \\ n = 1, 2, . . ., m \\ \Rightarrow ⟨ M^{n} ⟩ = \sum_{i = 1}^{N} P_{i} {M_{i}}^{n} \\ n = 1, . . ., m \\ m < < N \end{aligned}

Annahme:

Jedes Elementarereignis $A_{i}$ hat gleiche a-priori- Wahrscheinlichkeit, das heißt OHNE zusätzliche Kenntnisse $⟨ M^{n} ⟩$ gilt Gleichverteilung über den $A_{i}$ .

Informationstheoretisches Prinzip

(nach (Jaynes 1922-1998))

Suche die Wahrscheinlichkeitsverteilung, die unter der Erfüllung aller bekannten Angaben als Nebenbedingung die minimale Information enthält:

Also: $I (P) = \sum_{i = 1}^{N} P_{i} \ln P_{i} =! = M i n i m u m$

Nebenbed.:

\begin{aligned} \sum_{i = 1}^{N} P_{i} = 1 \\ ⟨ M^{n} ⟩ = \sum_{i = 1}^{N} P_{i} {M_{i}}^{n} \\ n = 1, . . ., m \end{aligned}

Variation: $δ I = \sum_{i = 1}^{N} (\ln P_{i} + 1) δ P_{i}$

Es gilt: von den N Variationen $δ P_{i}$ sind nur N-m-1 unabhängig voneinander!

\sum_{i}^{} δ P_{i} = 0

Lagrange- Multiplikator $λ = - (Ψ + 1)$

\sum_{i}^{} {M_{i}}^{n} δ P_{i} = 0

Lagrange- Multiplikator $λ_{n}$

Anleitung: Wähle $Ψ, λ_{n}$ so, dass die Koeffizienten von $(m + 1) δ P_{i}$ ´s verschwinden, die übrigen N-(m+1) sind dann frei variierbar!

Somit:

\Rightarrow δ I = \sum_{i = 1}^{N} (\ln P_{i} - Ψ + λ_{n} {M_{i}}^{n}) δ P_{i} =! = 0

Vorsicht: Auch Summe über $ν$ (Einsteinsche Summenkonvention!)

:

\Rightarrow P_{i} = \exp (Ψ - λ_{n} {M_{i}}^{n})

verallgemeinerte kanonische Verteilung

Die Lagrange- Multiplikatoren $Ψ, λ_{n}$ sind dann durch die m+1 Nebenbedingungen eindeutig bestimmt!

Kontinuierliche Ereignismenge

I (ρ) = \int_{}^{} d^{d} x ρ (x) \ln ρ (x) =! = M i n i m u m

unter der Nebenbedingung

\begin{aligned} \int_{}^{} d^{d} x ρ (x) = 1 \\ \int_{}^{} d^{d} x ρ (x) M^{n} (x) = ⟨ M^{n} ⟩ \\ n = 1, . . ., m \end{aligned}

Durchführung einer Funktionalvariation:

δ ρ (x)

\begin{aligned} δ I (ρ) = \int_{}^{} d^{d} x (\ln ρ (x) + 1) δ ρ (x) = 0 \\ \Rightarrow \int_{}^{} d^{d} x δ ρ (x) = 0 \\ \int_{}^{} d^{d} x M^{n} (x) δ ρ (x) = 0 \\ \Rightarrow \int_{}^{} d^{d} x (\ln ρ - Ψ + λ_{n} M^{n}) δ ρ (x) = 0 \\ \Rightarrow ρ (x) = \exp (Ψ - λ_{n} M^{n}) \end{aligned}

Vergleiche: A. Katz, Principles of Statistial Mechanics

ANMERKUNG Schubotz: Siehe auch ^[1]

Eigenschaften der verallgemeinerten kanonischen Verteilung

hier: noch rein informationstheoretisch,

später: wichtige Anwendungen in der Thermodynamik

Legendre- Transformation:

Sei $Ψ (t)$ eine Bahn!

Dann ist $M : = \frac{d Ψ (t)}{d t}$ die Geschwindigkeit.

Aus $Ψ (M)$ kann die Bahn $Ψ (t)$ noch nicht rekonstruiert werden, jedoch aus

I (M) = Ψ (t) - M (t) t

mit t=t(M):

\begin{aligned} \frac{d I}{d M} = \frac{d Ψ (t)}{d t} \frac{d t M}{d M} - M \frac{d t}{d M} - t \\ M : = \frac{d Ψ (t)}{d t} \\ \Rightarrow \frac{d I}{d M} = - t \end{aligned}

hieraus folgt

M (t)

eingesetzt in

I (M) = Ψ (t) - M (t) t \Rightarrow Ψ (t)

durch Eisnetzen gewinnt man

Ψ (t)

Jedenfalls:

I (M) = Ψ (t) - M (t) t

heißt legendre- Transformierte von

Ψ (t)

.

Anwendung auf die verallgemeinerte kanonische Verteilung:

\Rightarrow P_{i} = \exp (Ψ - λ_{n} {M_{i}}^{n})

Normierung:

\sum_{i}^{} P_{i} = 1 \Rightarrow e^{- Ψ} = \sum_{i} \exp (- λ_{n} {M_{i}}^{n}) \equiv Z

Also gilt:

Ψ = Ψ (λ_{1}, . . ., λ_{m})

und

P_{i}

sind durch

(λ_{1}, . . ., λ_{m})

vollständig parametrisiert.

Nebenbemerkung

Die Verteilung $P_{i}$ bzw. $ρ (x)$ wirkt auf dem Raum der Zufallsvariablen ${M_{i}}^{n}$ (diskret) bzw. $x \in R^{d}$ (kontinuierlich).

(λ_{1}, . . ., λ_{m})

sind Parameter.

⟨ M^{n} ⟩

sind Erwartungswerte

⟨ M^{n} ⟩ \in R

Beispiel:

x = (q_{1}, . . ., q_{3 N}, p_{1} . . . ., p_{3 N}) \in Γ

(Phasenraumelement)

mit $Γ$ als Phasenraum der kanonisch konjugierten Variablen

M (x) = \sum_{i = 1}^{3 N} (\frac{{p_{i}}^{2}}{2 m} + V (q_{i}))

mikrokanonisch Verteilungsfunktion

⟨ M (x) ⟩ = ⟨ \sum_{i = 1}^{3 N} (\frac{{p_{i}}^{2}}{2 m} + V (q_{i})) ⟩

als mittlere Energie

Shannon- Information:

\begin{aligned} I (P) = \sum_{i}^{} P_{i} \ln P_{i} = \sum_{i}^{} P_{i} (Ψ - λ_{n} {M_{i}}^{n}) = Ψ - λ_{n} \sum_{i}^{} P_{i} {M_{i}}^{n} \\ I = Ψ (λ_{1}, . . . λ_{m}) - λ_{n} ⟨ M^{n} ⟩ \end{aligned}

Aus $\begin{aligned} Ψ (λ_{1}, . . . λ_{m}) = - \ln \sum_{i}^{} \exp (- λ_{n} {M_{i}}^{n}) \\ \Rightarrow \frac{\partial}{\partial λ_{n}} Ψ = - \frac{\sum_{i}^{} (- {M_{i}}^{n}) \exp (- λ_{n} {M_{i}}^{n})}{\sum_{i}^{} \exp (- λ_{n} {M_{i}}^{n})} \\ \sum_{i}^{} \exp (- λ_{n} {M_{i}}^{n}) = e^{- Ψ} \\ \Rightarrow \frac{\partial}{\partial λ_{n}} Ψ = \sum_{i}^{} ({M_{i}}^{n}) \exp (Ψ - λ_{n} {M_{i}}^{n}) \\ \exp (Ψ - λ_{n} {M_{i}}^{n}) = P_{i} \\ \Rightarrow \frac{\partial}{\partial λ_{n}} Ψ = \sum_{i}^{} ({M_{i}}^{n}) P_{i} \\ \Rightarrow \frac{\partial}{\partial λ_{n}} Ψ = ⟨ M^{n} ⟩ \end{aligned}$

Damit können wir die Legendre- Transformation (verallgemeinert auf mehrere Variablen) identifizieren:

Ψ (t) \to Ψ (λ_{1}, . . . λ_{m})

Variable

λ_{n}

M \to ⟨ M^{n} ⟩ = \frac{\partial Ψ}{\partial λ_{n}}

neue Variable

⟨ M^{n} ⟩

I (M) \to I = Ψ - λ_{n} ⟨ M^{n} ⟩

Legendre- Transformierte von

Ψ

!

Es folgt:

\frac{\partial I}{\partial ⟨ M^{n} ⟩} = - λ_{n}

wegen:

\begin{aligned} \frac{\partial I}{\partial ⟨ M^{n} ⟩} = \frac{\partial Ψ}{\partial λ_{m}} \frac{\partial λ_{m}}{\partial ⟨ M^{n} ⟩} - \frac{\partial λ_{m}}{\partial ⟨ M^{n} ⟩} ⟨ M^{m} ⟩ - λ_{n} \\ \frac{\partial Ψ}{\partial λ_{m}} = ⟨ M^{m} ⟩ \\ \Rightarrow \frac{\partial I}{\partial ⟨ M^{n} ⟩} = - λ_{n} \end{aligned}

Zusammengefasst:

d I = - λ_{n} d ⟨ M^{n} ⟩

Dies ist in der Thermodynamik die Gibbsche Fundamentalgleichung!

Betachte Variation:

⟨ M^{n} ⟩ \to ⟨ M^{n} ⟩ + δ ⟨ M^{n} ⟩

dann:

\begin{aligned} λ_{n} \to λ_{n} + δ λ_{n} \\ Ψ \to Ψ + δ Ψ \\ P_{i} \to P_{i} + δ P_{i} \end{aligned}

Informationsgewinn:

\begin{aligned} K (P + δ P, P) = \sum_{i}^{} (P_{i} + δ P_{i}) \ln (P_{i} + δ P_{i}) - \sum_{i}^{} (P_{i} + δ P_{i}) \ln P_{i} \\ \sum_{i}^{} (P_{i} + δ P_{i}) \ln (P_{i} + δ P_{i}) = I (P + δ P) \\ \Rightarrow K (P + δ P, P) = (Ψ + δ Ψ) - (λ_{n} + δ λ_{n}) (⟨ M^{n} ⟩ + δ ⟨ M^{n} ⟩) - \sum_{i}^{} (P_{i} + δ P_{i}) (Ψ - λ_{n} {M^{n}}_{i}) \\ \sum_{i}^{} (P_{i} + δ P_{i}) (Ψ - λ_{n} {M^{n}}_{i}) = Ψ - λ_{n} \sum_{i}^{} (P_{i} + δ P_{i}) {M^{n}}_{i} = Ψ - λ_{n} (⟨ M^{n} ⟩ + δ ⟨ M^{n} ⟩) \\ \Rightarrow K (P + δ P, P) = (Ψ + δ Ψ) - (λ_{n} + δ λ_{n}) (⟨ M^{n} ⟩ + δ ⟨ M^{n} ⟩) - Ψ + λ_{n} (⟨ M^{n} ⟩ + δ ⟨ M^{n} ⟩) \\ = δ Ψ - δ λ_{n} (⟨ M^{n} ⟩ + δ ⟨ M^{n} ⟩) \end{aligned}

Wir können die variierten Funktionen für kleine Variationen

δ λ_{n}

entwickeln:

\begin{aligned} δ Ψ = \frac{\partial Ψ}{\partial λ_{n}} δ λ_{n} + \frac{1}{2} \frac{\partial^{2} Ψ}{\partial λ_{n} \partial λ_{m}} δ λ_{n} δ λ_{m} + . . . . \\ δ ⟨ M^{n} ⟩ = \frac{\partial ⟨ M^{n} ⟩}{\partial λ_{n}} δ λ_{n} + \frac{1}{2} \frac{\partial^{2} ⟨ M^{n} ⟩}{\partial λ_{n} \partial λ_{m}} δ λ_{n} δ λ_{m} + . . . . \\ \Rightarrow K (P + δ P, P) = δ Ψ - δ λ_{n} (⟨ M^{n} ⟩ + δ ⟨ M^{n} ⟩) = (\frac{\partial Ψ}{\partial λ_{n}} δ λ_{n} - ⟨ M^{n} ⟩) δ λ_{n} + (\frac{1}{2} \frac{\partial}{\partial λ_{m}} \frac{\partial Ψ}{\partial λ_{n}} - \frac{\partial ⟨ M^{n} ⟩}{\partial λ_{m}}) δ λ_{n} δ λ_{m} \\ \frac{\partial Ψ}{\partial λ_{n}} = ⟨ M^{n} ⟩ \Rightarrow (\frac{1}{2} \frac{\partial}{\partial λ_{m}} \frac{\partial Ψ}{\partial λ_{n}} - \frac{\partial ⟨ M^{n} ⟩}{\partial λ_{m}}) = - \frac{1}{2} \frac{\partial ⟨ M^{n} ⟩}{\partial λ_{m}} \\ (\frac{\partial Ψ}{\partial λ_{n}} δ λ_{n} - ⟨ M^{n} ⟩) = 0 \\ \Rightarrow K (P + δ P, P) = - \frac{1}{2} \frac{\partial ⟨ M^{n} ⟩}{\partial λ_{m}} δ λ_{n} δ λ_{m} \\ K (P + δ P, P) \geq 0 \end{aligned}

Vergleiche oben

also folgt:

\begin{aligned} \Rightarrow K (P + δ P, P) = - \frac{1}{2} \frac{\partial ⟨ M^{n} ⟩}{\partial λ_{m}} δ λ_{n} δ λ_{m} \geq 0 \\ \Rightarrow \frac{\partial ⟨ M^{n} ⟩}{\partial λ_{m}} \leq 0 \end{aligned}

negativ semidefinit, für alle $δ λ_{m}$

Definiere Suszeptibilitätsmatrix:

η^{m n} : = \frac{\partial ⟨ M^{n} ⟩}{\partial λ_{n}} = \frac{\partial^{2} Ψ}{\partial λ_{n} \partial λ_{m}}

Diese Matrix beschreibt die Änderung von $⟨ M^{m} ⟩$ bei Variation von $λ_{n}$ :

δ ⟨ \bar{M} ⟩ = \bar{\bar{η}} δ \bar{λ}

bzw.:

{\tilde{η}}_{σ λ} : = \frac{\partial λ_{σ}}{\partial ⟨ M^{λ} ⟩} = - \frac{\partial^{2} I}{\partial ⟨ M^{λ} ⟩ \partial ⟨ M^{σ} ⟩}

In Matrixschreibweise:

\begin{aligned} δ \bar{λ} = \tilde{\bar{\bar{η}}} δ ⟨ \bar{M} ⟩ \\ \tilde{\bar{\bar{η}}} = {\bar{\bar{η}}}^{- 1} \end{aligned}

Wegen

\begin{aligned} \frac{\partial}{\partial λ_{n}} (\frac{\partial Ψ}{\partial λ_{m}}) = \frac{\partial}{\partial λ_{m}} (\frac{\partial Ψ}{\partial λ_{n}}) \\ (\frac{\partial Ψ}{\partial λ_{m}}) = ⟨ M^{m} ⟩ \Rightarrow \frac{\partial}{\partial λ_{n}} (\frac{\partial Ψ}{\partial λ_{m}}) = η^{m n} \\ (\frac{\partial Ψ}{\partial λ_{n}}) = ⟨ M^{n} ⟩ \Rightarrow \frac{\partial}{\partial λ_{m}} (\frac{\partial Ψ}{\partial λ_{n}}) = η^{n m} \end{aligned}

Somit:

η^{n m}

ist symmetrisch

Aus $K (P + δ P, P) \geq 0$ folgt:

η^{m n} δ λ_{m} δ λ_{n} = δ ⟨ M^{n} ⟩ δ λ_{n} = {\tilde{η}}_{n m} δ ⟨ M^{n} ⟩ δ ⟨ M^{m} ⟩ \leq 0

Also: negativ- semidefinite quadratisceh Form:

\begin{aligned} \Rightarrow η^{n n} \leq 0 \\ {\tilde{η}}_{n n} \leq 0 \end{aligned}

Nebenbemerkung:

Also sind $I (⟨ M^{n} ⟩)$ und $- Ψ (λ_{n})$ konvex!

Zusammenhang mit der Korrelationsmatrix

Q^{m n} : = ⟨ Δ M^{m} Δ M^{n} ⟩

ist Korrelationsmatrix (siehe oben)

= {⟨ M^{m} M^{n} ⟩}_{c}

2. Kumulante

= {\frac{\partial^{2} Γ (α)}{\partial α_{m} \partial α_{n}} |}_{α = 0}

mit Kumulantenerzeugender

\begin{aligned} Γ (α) = \ln ⟨ \exp (α_{n} M^{n}) ⟩ = \ln \sum_{i}^{} P_{i} \exp (α_{n} {M_{i}}^{n}) = \ln \sum_{i}^{} e^{Ψ - (λ_{n} - α_{n}) {M_{i}}^{n}} \\ = \ln [e^{Ψ} \cdot \sum_{i}^{} e^{- (λ_{n} - α_{n}) {M_{i}}^{n}}] = Ψ (λ) + \ln [\sum_{i}^{} e^{- (λ_{n} - α_{n}) {M_{i}}^{n}}] \\ \ln [\sum_{i}^{} e^{- (λ_{n} - α_{n}) {M_{i}}^{n}}] = - Ψ (λ - α) \\ \Rightarrow Γ (α) = Ψ (λ) - Ψ (λ - α) \\ \Rightarrow Q^{m n} = - {\frac{\partial^{2} Ψ (λ - α)}{\partial α_{m} \partial α_{n}} |}_{α = 0} = - \frac{\partial^{2} Ψ (λ)}{\partial λ_{m} \partial λ_{n}} = - η^{m n} \end{aligned}

Suszeptibilität!

Also: Die Korrelationsmatrix ist das Negative der Suszeptibilität!!

Also:

Q^{m n} : = ⟨ Δ M^{m} Δ M^{n} ⟩ = - \frac{\partial ⟨ M^{m} ⟩}{\partial λ_{n}} = - \frac{\partial ⟨ M^{n} ⟩}{\partial λ_{m}}

Fluktuations/ Dissipations- Theorem:

Fluktuationen: Zufällige Schwankungen um den Mittelwert

Dissipation: Systematische Änderung der Mittelwerte!

Korrektur einer Verteilung durch Zusatzinformationen

Sei $P^{0}$ die Verteilung, die $I (P)$ unter Kenntnis der Nebenbedingungen

\begin{aligned} \sum_{i}^{} {P_{i}}^{0} = 1 \\ \sum_{i}^{} {P_{i}}^{0} {M_{i}}^{m} = ⟨ M^{m} ⟩ \\ m = 1, . . ., m \end{aligned}

minimalisiert (Vorsicht: Index und Laufende sind ungünstigerweise gleich bezeichnet!)

Jetzt:

Zusatzinformationen (zusätzliche Mittelwerte beobachtet):

\begin{aligned} \sum_{i}^{} P_{i} {V_{i}}^{σ} = ⟨ {V_{i}}^{σ} ⟩ \\ σ = 1, . . ., s \\ \sum_{i}^{} P_{i} = 1 \end{aligned}

Prinzip der vorurteilsfreien Schätzung

Suche Minimum des Informationsgewinns

K (P, P^{0}) = \sum_{i}^{} P_{i} \ln \frac{P_{i}}{{P_{i}}^{0}}

unter dieser Nebenbedingung!!

Also:

\sum_{i}^{} (\ln P_{i} - \ln {P_{i}}^{0} + 1 + ξ + ξ_{σ} {V_{i}}^{σ}) δ P_{i} = 0

mit neuen Lagrange- Multiplikatoren

ξ, ξ_{σ}

\begin{aligned} \Rightarrow 1 + ξ = - Ξ \\ \sum_{i}^{} (\ln P_{i} - \ln {P_{i}}^{0} - Ξ + ξ_{σ} {V_{i}}^{σ}) δ P_{i} = 0 \\ \Rightarrow P_{i} = {P_{i}}^{0} \exp (Ξ - ξ_{σ} {V_{i}}^{σ}) \end{aligned}

Mit

{P_{i}}^{0} = \exp (Ψ - λ_{n} {M_{i}}^{n})

 folgt:

\begin{aligned} K (P, P^{0}) = \sum_{i}^{} P_{i} \ln P_{i} - P_{i} \ln {P_{i}}^{0} + {P_{i}}^{0} \ln {P_{i}}^{0} - {P_{i}}^{0} \ln {P_{i}}^{0} \\ \sum_{i}^{} P_{i} \ln P_{i} = I (P) \\ \sum_{i}^{} {P_{i}}^{0} \ln {P_{i}}^{0} = I (P^{0}) \\ - P_{i} \ln {P_{i}}^{0} + {P_{i}}^{0} \ln {P_{i}}^{0} = - \sum_{i}^{} (P_{i} - {P_{i}}^{0}) \ln {P_{i}}^{0} \\ \ln {P_{i}}^{0} = Ψ - λ_{n} {M_{i}}^{n} \\ - \sum_{i}^{} (P_{i} - {P_{i}}^{0}) (Ψ - λ_{n} {M_{i}}^{n}) = λ_{n} (\sum_{i}^{} (P_{i} {M_{i}}^{n}) - \sum_{i}^{} ({P_{i}}^{0} {M_{i}}^{n})) \\ \sum_{i}^{} (P_{i} {M_{i}}^{n}) = ⟨ M^{n} ⟩ \\ \sum_{i}^{} ({P_{i}}^{0} {M_{i}}^{n}) = {⟨ M^{n} ⟩}_{0} \end{aligned}

Da nun die Mittelwerte

⟨ M^{n} ⟩, {⟨ M^{n} ⟩}_{0}

nicht durch die Zusatzinfo geändert werden muss gelten:

\begin{aligned} K (P, P^{0}) = I (P) - I (P^{0}) + λ_{n} (\sum_{i}^{} (P_{i} {M_{i}}^{n}) - \sum_{i}^{} ({P_{i}}^{0} {M_{i}}^{n})) \\ = I (P) - I (P^{0}) + λ_{n} (⟨ M^{n} ⟩ - {⟨ M^{n} ⟩}_{0}) \\ k e i n e \ddot{A} n d e r u n g \\ \Rightarrow λ_{n} (⟨ M^{n} ⟩ - {⟨ M^{n} ⟩}_{0}) = 0 \\ ⟨ M^{n} ⟩ = {⟨ M^{n} ⟩}_{0} \end{aligned}

da diese Mittelwerte nicht durch die Zusatzinfo geändert werden!

\begin{aligned} \Rightarrow K (P, P^{0}) = I (P) - I (P^{0}) + λ_{n} (\sum_{i}^{} (P_{i} {M_{i}}^{n}) - \sum_{i}^{} ({P_{i}}^{0} {M_{i}}^{n})) \\ = I (P) - I (P^{0}) + λ_{n} (⟨ M^{n} ⟩ - {⟨ M^{n} ⟩}_{0}) = I (P) - I (P^{0}) \end{aligned}

Das heißt: Der Informationsgewinn entspricht gerade der Änderung der Shannon- Info!

Siehe auch

↑ Brandes,T, Thermodynamik und Statistische Physik, Vorlesung, TU-Berlin, Wintersemester 2006/2007, Gleichung 5.4.13 (Kap 5.4.3 S46)

[1] Brandes,T, Thermodynamik und Statistische Physik, Vorlesung, TU-Berlin, Wintersemester 2006/2007, Gleichung 5.4.13 (Kap 5.4.3 S46)

[1]